在自主机器人导航中,对视觉场所识别(VPR)的次数最佳观看(NBV)计划者的培训是一项重要的任务,典型的方法是使用目标域中收集的视觉体验作为培训数据。但是,对于实时的机器人应用,在日常导航中收集了各种各样的视觉体验。我们通过采用小说{\ it domain-invariant} NBV计划来解决这个问题。假定基于卷积神经网络(CNN)的标准VPR子系统可用,并建议将其域不变状态识别能力转移以训练域不变的NBV计划者。具体而言,我们将CNN模型可用的视觉提示分为两种类型:输出层提示(OLC)和中间层提示(ILC)。 OLC可在CNN模型的输出层上可用,旨在估计机器人的状态(例如,机器人观点)相对于以世界为中心的视图坐标系。 ILC在CNN模型的中间层中可用,作为对以自我为中心的视图的视觉内容(例如显着图像)的高级描述。在我们的框架中,ILC和OLC被映射到国家向量,随后用于通过深入的强化学习来训练多视NBV规划师。使用公共NCLT数据集的实验验证了提出方法的有效性。
translated by 谷歌翻译
In this paper, we propose a novel architecture called Composition Attention Grammars (CAGs) that recursively compose subtrees into a single vector representation with a composition function, and selectively attend to previous structural information with a self-attention mechanism. We investigate whether these components -- the composition function and the self-attention mechanism -- can both induce human-like syntactic generalization. Specifically, we train language models (LMs) with and without these two components with the model sizes carefully controlled, and evaluate their syntactic generalization performance against six test circuits on the SyntaxGym benchmark. The results demonstrated that the composition function and the self-attention mechanism both play an important role to make LMs more human-like, and closer inspection of linguistic phenomenon implied that the composition function allowed syntactic features, but not semantic features, to percolate into subtree representations.
translated by 谷歌翻译
超级解决全球气候模拟的粗略产出,称为缩减,对于需要长期气候变化预测的系统做出政治和社会决策至关重要。但是,现有的快速超分辨率技术尚未保留气候数据的空间相关性,这在我们以空间扩展(例如运输基础设施的开发)处理系统时尤其重要。本文中,我们展示了基于对抗性的网络的机器学习,使我们能够在降尺度中正确重建区域间空间相关性,并高达五十,同时保持像素统计的一致性。与测量的温度和降水分布的气象数据的直接比较表明,整合气候上重要的物理信息对于准确的缩减至关重要,这促使我们称我们的方法称为$ \ pi $ srgan(物理学知情的超级分辨率生成生成的对手网络)。本方法对气候变化影响的区域间一致评估具有潜在的应用。
translated by 谷歌翻译
ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列,该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战,这是由于探测器的几何形状,不均匀的散射和冰中光的吸收,并且低于100 GEV的光,每个事件产生的信号光子数量相对较少。为了应对这一挑战,可以将ICECUBE事件表示为点云图形,并将图形神经网络(GNN)作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开,对不同的中微子事件类型进行分类,并重建沉积的能量,方向和相互作用顶点。基于仿真,我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术,包括已知系统不确定性的影响。对于中微子事件分类,与当前的IceCube方法相比,GNN以固定的假阳性速率(FPR)提高了信号效率的18%。另外,GNN在固定信号效率下将FPR的降低超过8(低于半百分比)。对于能源,方向和相互作用顶点的重建,与当前最大似然技术相比,分辨率平均提高了13%-20%。当在GPU上运行时,GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件,这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。
translated by 谷歌翻译
游戏中的学习理论在AI社区中很突出,这是由多个不断上升的应用程序(例如多代理增强学习和生成对抗性网络)的动机。我们提出了突变驱动的乘法更新(M2WU),以在两人零和零正常形式游戏中学习平衡,并证明它在全面和嘈杂的信息反馈设置中都表现出了最后的题融合属性。在全信息反馈设置中,玩家观察了实用程序功能的确切梯度向量。另一方面,在嘈杂的信息反馈设置中,他们只能观察到嘈杂的梯度向量。现有的算法,包括众所周知的乘法权重更新(MWU)和乐观的MWU(OMWU)算法,未能收敛到具有嘈杂的信息反馈的NASH平衡。相反,在两个反馈设置中,M2WU表现出最后的近期收敛到NASH平衡附近的固定点。然后,我们证明它通过迭代地适应突变项来收敛到精确的NASH平衡。我们从经验上确认,M2WU在可剥削性和收敛速率方面胜过MWU和OMWU。
translated by 谷歌翻译
最近,针对各种实际应用,例如操纵学习,已经广泛探索了触觉手套。以前的手套设备具有不同的力驱动系统,例如形状记忆合金,伺服电动机和气动执行器;但是,这些提议的设备在快速运动,易于繁殖和安全问题方面可能难以置信。在这项研究中,我们提出了Magglove,这是一种具有线性电动机的可移动磁铁机制的新型触觉手套,以解决这些问题。拟议的Magglove设备是佩戴者手背面紧凑的系统,具有很高的响应性,易用性和良好的安全性。提出的设备是自适应的,随着电流流过线圈的大小的修饰。基于我们的评估研究,可以证实所提出的设备可以在给定任务中实现手指运动。因此,Magglove可以为操纵学习任务中的佩戴者学习水平提供量身定制的灵活支持。
translated by 谷歌翻译
在这项研究中,我们考虑了两个玩家零和游戏中的正规领导者(FTRL)动力学的变体。在时间平衡策略时,FTRL保证会融合到NASH平衡,而许多变体都遭受了极限自行车行为的问题,即缺乏最后的介质收敛保证。为此,我们提出了一种突变FTRL(M-FTRL),该算法引入了用于动作概率扰动的突变。然后,我们研究了M-FTRL的连续时间动力学,并提供了强大的收敛保证,可以向固定点提供近似于NASH平衡的固定点。此外,我们的仿真表明,M-FTRL比FTRL和乐观的FTRL在全信息反馈下享有更快的收敛速度,并且在强盗反馈下表现出明显的收敛性。
translated by 谷歌翻译
This article presents our generative model for rhythm action games together with applications in business operations. Rhythm action games are video games in which the player is challenged to issue commands at the right timings during a music session. The timings are rendered in the chart, which consists of visual symbols, called notes, flying through the screen. We introduce our deep generative model, Gen\'eLive!, which outperforms the state-of-the-art model by taking into account musical structures through beats and temporal scales. Thanks to its favorable performance, Gen\'eLive! was put into operation at KLab Inc., a Japan-based video game developer, and reduced the business cost of chart generation by as much as half. The application target included the phenomenal "Love Live!," which has more than 10 million users across Asia and beyond, and is one of the few rhythm action franchises that has led the online era of the genre. In this article, we evaluate the generative performance of Gen\'eLive! using production datasets at KLab as well as open datasets for reproducibility, while the model continues to operate in their business. Our code and the model, tuned and trained using a supercomputer, are publicly available.
translated by 谷歌翻译
我们呈现隐藏状态优化(HSO),一种基于梯度的方法,用于提高推理时间的变压器语言模型的性能。类似于动态评估(KRAUE等,2018),HSO计算语言模型分配给评估文本的日志概率的渐变,但使用它来更新缓存的隐藏状态而不是模型参数。我们用预磨削的变换器-XL和GPT-2语言模型测试HSO,在困惑方面发现Wikitext103和PG-19数据集的改进,特别是在评估其培训分布之外的模型时。我们还通过在最近开发的基于少量拍摄评估设置中显示出口,再次展示下游适用性,没有额外的参数或培训数据。
translated by 谷歌翻译
未用性的自治车辆(无人机)在过去的美国军事活动中对侦察和监督任务进行了重大贡献。随着无人机的普遍性增加,柜台上还有改进,使他们难以在感兴趣的领域成功获得宝贵的智能。因此,现代无人机可以在最大化他们的生存机会的同时实现他们的任务已经重要。在这项工作中,我们专门研究从指定开始到目标的识别短路的问题,同时收集所有奖励,避免随机移动到网格上的对手。我们还可以在军事环境中提供框架的可能应用,即自动伤员疏散。我们展示了三种方法来解决这个问题的比较:即我们实施一个深度Q学习模型,一个$ \ varepsilon $ -greedy表格Q学习模型,以及在线优化框架。我们的计算实验,使用具有随机对手的简单网格世界环境设计,展示这些方法如何工作,并在性能,准确性和计算时间方面进行比较。
translated by 谷歌翻译